We propose a path planning methodology for a mobile robot navigating through an obstacle-filled environment to generate a reference path that is traceable with moderate sensing efforts. The desired reference path is characterized as the shortest path in an obstacle-filled Gaussian belief manifold equipped with a novel information-geometric distance function. The distance function we introduce is shown to be an asymmetric quasi-pseudometric and can be interpreted as the minimum information gain required to steer the Gaussian belief. An RRT*-based numerical solution algorithm is presented to solve the formulated shortest-path problem. To gain insight into the asymptotic optimality of the proposed algorithm, we show that the considered path length function is continuous with respect to the topology of total variation. Simulation results demonstrate that the proposed method is effective in various robot navigation scenarios to reduce sensing costs, such as the required frequency of sensor measurements and the number of sensors that must be operated simultaneously.
translated by 谷歌翻译
For augmentation of the square-shaped image data of a convolutional neural network (CNN), we introduce a new method, in which the original images are mapped onto a disk with a conformal mapping, rotated around the center of this disk and mapped under such a M\"obius transformation that preserves the disk, and then mapped back onto their original square shape. This process does not result the loss of information caused by removing areas from near the edges of the original images unlike the typical transformations used in the data augmentation for a CNN. We offer here the formulas of all the mappings needed together with detailed instructions how to write a code for transforming the images. The new method is also tested with simulated data and, according the results, using this method to augment the training data of 10 images into 40 images decreases the amount of the error in the predictions by a CNN for a test set of 160 images in a statistically significant way (p-value=0.0360).
translated by 谷歌翻译
我们将WS-DINO作为一种新型框架,以从细胞的高内感荧光图像学习表型表示中使用弱标记信息。我们的模型基于具有视觉变压器骨干(Dino)的知识蒸馏方法,我们将其用作研究的基准模型。使用WS-DINO,我们对高含量显微镜屏幕(处理和化合物)中可用的弱标签信息进行了微调,并在BBBC021数据集的非同样化合物的动作预测中实现了最先进的性能(98%),并使用该化合物作为弱标签,而非类型的化合物和批处理性能(96%)。我们的方法绕过单细胞种植作为预处理步骤,并使用自发图表表明该模型学习结构上有意义的表型曲线。
translated by 谷歌翻译
在各种Web应用程序(例如数字广告和电子商务)中使用多模式数据的兴趣越来越大。从多模式数据中提取重要信息的典型方法取决于结合了来自多个编码器的特征表示的中型架构。但是,随着模态数量的增加,中融合模型结构的几个潜在问题会出现,例如串联多模式特征和缺失模态的维度增加。为了解决这些问题,我们提出了一个新概念,该概念将多模式输入视为一组序列,即深度多模式序列集(DM $^2 $ S $^2 $)。我们的设置感知概念由三个组成部分组成,这些组件捕获了多种模式之间的关系:(a)基于BERT的编码器来处理序列中元素间和内级内和内级的编码器,(b)模式内的残留物(Intramra)(Intramra) )捕获元素在模态中的重要性,以及(c)模式间残留的关注(Intermra),以进一步增强具有模态水平粒度的元素的重要性。我们的概念表现出与以前的设置感知模型相当或更好的性能。此外,我们证明了学识渊博的Intermra和Intramra权重的可视化可以提供对预测结果的解释。
translated by 谷歌翻译
在本文中,我们开发了一种使用深神经网络(DNNS)的非组织和非线性时间序列的自适应非参数估计的一般理论。我们首先考虑两种类型的DNN估计量,非含糖和稀疏的DNN估计器,并为一般非平稳时间序列建立其泛化误差界限。然后,我们得出最小值下限,以估计属于一类非线性自回旋(AR)模型的平均功能,这些功能包括非线性通用添加剂AR,单个索引和阈值AR模型。在结果的基础上,我们表明稀疏的DNN估计量具有自适应性,并达到了许多非线性AR模型的最小最佳速率,直至多构型因子。通过数值模拟,我们证明了DNN方法在估计具有内在的低维结构和不连续或粗糙平均功能的非线性AR模型的有用性,这与我们的理论一致。
translated by 谷歌翻译
在本文中,我们讨论了在构建基于AI的交互式系统中应用无监督的异常检测的潜力,该系统与领域专家合作处理高度上下文情况,即人类的交流。我们通过为执行教练开发计算支持工具的经验来实现这种利用无监督的异常检测方法,这教会了我们提供可解释的结果的重要性,以便专家教练可以考虑结果和背景。这种方法背后的关键思想是为专家教练留出空间来释放其开放式解释,而不是简化社交互动的本质,即通过常规监督算法可以解决的明确定义的问题。此外,我们发现这种方法可以扩展到培养新手教练。通过促使他们解释系统的结果,它可以为教练提供教育机会。尽管该方法的适用性应在其他领域进行验证,但我们认为,利用无监督的异常检测来构建基于AI的交互式系统的想法将揭示人类交流的另一个方向。
translated by 谷歌翻译
语言模型既展示了定量的改进,又展示了新的定性功能,随着规模的增加。尽管它们具有潜在的变革性影响,但这些新能力的特征却很差。为了为未来的研究提供信息,为破坏性的新模型能力做准备,并改善社会有害的效果,至关重要的是,我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战,我们介绍了超越模仿游戏基准(Big Bench)。 Big Bench目前由204个任务组成,由132家机构的442位作者贡献。任务主题是多样的,从语言学,儿童发展,数学,常识性推理,生物学,物理学,社会偏见,软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号,Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为,跨越了数百万到数十亿个参数。此外,一个人类专家评估者团队执行了所有任务,以提供强大的基准。研究结果包括:模型性能和校准都随规模改善,但绝对的术语(以及与评估者的性能相比);在模型类中的性能非常相似,尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分,而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标;社交偏见通常会随着含糊不清的环境而随着规模而增加,但这可以通过提示来改善。
translated by 谷歌翻译
我们介绍了我们的案例研究,旨在帮助专业评估者在人类评估中做出决定,他们在其中对被评估者进行访谈并评估其对某些工作角色的适用性。我们与两名工业评估者的研讨会表明,可以从面试视频中提取非语言评估的计算系统对评估者的支持将对他们的决策做出有益。作为响应,我们使用多模式行为特征(例如面部关键点,姿势,头姿势和凝视)基于无监督的异常检测算法开发了这样的系统。此外,我们使系统能够输出每个功能导致检测线索的异常值的贡献,以增强其可解释性。然后,我们通过使用20个实际评估访谈视频并涉及两位评估员,以研究系统输出的有效性,以检查系统输出的有效性。结果表明,通过说明其评估者产出的信息性,以可解释的方式使用无监督的异常检测的优势。我们的方法以人为组合中的观察和解释分离为基础,它将促进在高度背景领域(例如人类评估)中的人类决策,同时保持其对系统的信任。
translated by 谷歌翻译
当许多机器人必须在狭窄的空间中一起工作时,可以通过向前时间窗口进行精确的协调计划,可以安全,高效的运动,但这通常需要对所有设备的集中控制,这很难扩展。我们演示了GBP计划,这是一种基于高斯信念传播的多机器人计划问题的新型纯粹分布技术,该技术由定义动态和碰撞约束的通用因素图制成。在模拟中,我们表明我们的方法允许极高的性能协作计划,在繁忙,复杂的场景中,机器人能够互相交叉。即使在沟通失败的情况下,它们也比替代分布式计划技术保持更短,更快,更光滑的轨迹。
translated by 谷歌翻译
非线性动力学的现实世界复杂系统的分析和预测在很大程度上取决于替代模型。储层计算机(RC)已被证明可用于复制混沌动力学的气候。基于RCS的替代模型的质量至关重要取决于明智地确定的最佳实现,涉及选择最佳储层拓扑和超参数。通过系统地应用贝叶斯高参数优化并使用各种拓扑的储层集合,我们表明,链接储层的拓扑结构在预测混乱的Lorenz系统的动态方面没有意义。通过模拟,我们表明,未连接的节点的简单储层优于链接的储层作为不同制度中洛伦兹系统的替代模型的链接储层。我们给出了为什么未连接节点的储层具有最大熵,因此是最佳的。我们得出的结论是,RC的性能是基于仅仅是功能转换,而不是通常假定的动力学特性。因此,可以通过在模型中更强烈的动态信息来改进RC。
translated by 谷歌翻译